Évaluation des annotations : ses principes et ses pièges

نویسندگان

  • Yann Mathet
  • Antoine Widlöcher
چکیده

A lot of data is produced by NLP (automatic systems) and for NLP (reference corpus, for computational linguistics or for machine learning) and should be publicly released only if their consistency is proven. While the growing effort that has been made in this direction over the past two decades is encouraging, for example through the increasing use of inter-annotating agreement measures such as kappa, it is not always accompanied by sufficient knowledge of the principles underlying evaluation or the rigor required for their application. The aim of this paper is to present and question the basic concepts and principles of the domain (e.g., shall we use "chance correction" in agreement measures, and if so, how?), and to illustrate with concrete and quantified examples the consequences of an approximate practice of evaluation. MOTS-CLÉS : accord inter-annotateurs, gold standard, évaluation d’annotations.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Sampling Saproxylic Beetles with Window Flight Traps: Methodological Insights

RÉSUMÉ. — Regards méthodologiques sur l’échantillonnage des coléoptères saproxyliques au moyen des pièges-vitres. — Les coléoptères saproxyliques constituent un groupe riche en espèces, souvent petites et cryptiques, et diffi ciles à échantillonner. Différentes méthodes sont traditionnellement utilisées pour les collecter: les techniques (i) de collecte active, (ii) d’élevage et (iii) de piégea...

متن کامل

Modélisation des satisfactions personnelle et interactive d'agents situés coopératifs

RÉSUMÉ. Cet article aborde le problème de l’évaluation, par l’agent, de ses actions et interactions. Nous proposons un modèle des satisfactions différenciant actions individuelles et interactions avec les agents voisins. La satisfaction personnelle est calculée incrémentalement dans le temps suivant la perception de la progression de la tâche en cours. La satisfaction interactive est une évalua...

متن کامل

Une introduction à la Set-Theory

Cet article se propose d'introduire les concepts de base de la Set-Theory aussi bien dans l'approche « classique » d'Allen Forte que dans les développements récents de la théorie « transformationnelle » de David Lewin. Malgré l'abondance de publications autour de la Set-Theory dans les Universités et les centres de recherche Nord-américains, cette approche reste souvent peu connue en Europe dan...

متن کامل

The Twelve Principles of Incentive Pay

Reproduction partielle permise avec citation du document source, incluant la notice ©. Short sections may be quoted without explicit permission, if full credit, including © notice, is given to the source. CIRANO Le CIRANO est un organisme sans but lucratif constitué en vertu de la Loi des compagnies du Québec. Le financement de son infrastructure et de ses activités de recherche provient des co...

متن کامل

Accès personnalisé à des sources de données multiples: évaluation de deux approches de reformulation de requêtes

RÉSUMÉ. Les systèmes de médiation actuels permettent un accès transparent à un ensemble de sources de données hétérogènes. Le but de la personnalisation est de faciliter l’expression du besoin de l’utilisateur et lui permettre d’obtenir des informations pertinentes en exploitant au mieux ses préférences regroupées dans un profil. Dans un contexte de médiation, la personnalisation doit tenir com...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:
  • TAL

دوره 57  شماره 

صفحات  -

تاریخ انتشار 2016